

## 存储系统存在的问题

双端口RAM、多模块存储器提高存储器的工作速度

优化后速度与CPU差距 依然很大

更高速的存储单元设计

存储器价格↑容量↓

存储体系的改善"Cache-主存"层次

程序访问的局部性原理

# Cache的工作原理



## Cache的工作原理



辅存(128GB)



### 局部性原理

#### 程序A:

```
1  int sumarrayrows(int a[M][N])
2  {
3    int i, j, sum = 0;
4    for (i = 0; i < M; i++)
5        for (j = 0; j < N; j++)
6            sum += a[i][j];
7    return sum;
8  }</pre>
```

#### 程序B:

```
1  int sumarraycols(int a[M][N])
2  {
3    int i, j, sum = 0;
4    for (j = 0; j < N; j++)
5    for (i = 0; i < M; i++)
6        sum += a[i][j];
7    return sum;
8  }</pre>
```



指令和数据在内存中的存储

Eg: 数组元素、顺序执 行的指令代码

空间局部性:在最近的未来要用到的信息(指令和数据),很可能与现在正在使用的信息在存储空间上是邻近的

时间局部性:在最近的未来要用到的信息,很可能是现在正在使用的信息

Eg: 循环结构的 指令代码

基于局部性原理,不难想到,可以把CPU目前访问的地址"周围"的部分数据放到Cache中

程序B按"列优先"访问二维数组,空间局部性更差

#### 性能分析



内存 (4GB)

文字聊天 视频聊天

朋友圈

.....

其他数据

设t。为访问一次Cache所需时间, tm为访问一次主存所需时间

<mark>命中率</mark>H: CPU欲访问的信息已在 Cache中的比率

缺失(未命中)率M=1-H

Cache—主存 系统的<mark>平均访问时间 t</mark>为 t = Htc + (1 - H)(tc + tm)

先访问Cache,若Cache未命中再访问主存

或 
$$t = Htc + (1 - H)t_m$$

同时访问 Cache和主存,若Cache 命中则立即停止访问主存

#### 性能分析

【例3-2】 假设Cache的速度是主存的5倍,且Cache的命中率为95%,则采用Cache后,存储器性能提高多少(设Cache和主存同时被访问,若Cache命中则中断访问主存)?

设Cache的存取周期为t,则主存的存取周期为5t

 $\frac{\text{ECache和主存同时访问}}{\text{ECache和主存同时访问}}$ ,命中时访问时间为t,未命中时访问时间为t1.2t2

故性能为原来的  $\frac{5t}{1.2t}$  ≈4.17倍

<mark>若先访问Cache再访问主存</mark>,命中时访问时间为t,未命中时访问时间为 t+5t 平均访问时间为 $T_a$ =0.95×t + 0.05×6t = 1.25t

故性能为原来的 $\frac{5t}{1.25t}$ =4倍

# 有待解决的问题

基于局部性原理,不难想到,可以把CPU目前访问的地址"周围"的部分数据放到Cache中。如何界定"周围"?

将主存的 存储空间"分块",如:每 1KB 为一块。主存与Cache之间以"块"为单位进行数据交换





#### 有待解决的问题

基于局部性原理,不难想到,可以把CPU目前访问的地址"周围"的部分数据放到Cache中。如何界定"周围"?

将主存的 存储空间"分块",如:每1KB为一块。主存与Cache之间以"块"为单位进行数据交换

注:操作系统中,通常将主存中的"一个块"也称为"一个页/页面/页框"

Cache中的"块"也称为"行"



主存的地址共22位:

| 块号  | 块内地址 |
|-----|------|
| 12位 | 10位  |

4M=2<sup>22</sup>,1K=2<sup>10</sup> 整个主存被分为 2<sup>12</sup> = 4096 块

### 有待解决的问题



注意:每次被访问的主存块, 一定会被立即调入Cache

主存的地址共22位:

| 块号  | 块内地址 |
|-----|------|
| 12位 | 10位  |

4M=2<sup>22</sup>,1K=2<sup>10</sup> 整个主存被分为 2<sup>12</sup> = 4096 块

- 如何区分 Cache 与 主存 的数据块对应关系?
- Cache 很小,主存很大。如果Cache满了怎么办?
- CPU修改了Cache中的数据副本,如何确保主存中数据母本的一致性?
- ——Cache和主存的映射方式
- --替换算法
- ——Cache写策略

#### 知识回顾



- 如何区分 Cache 与 主存 的数据块对应关系?
- Cache 很小,主存很大。如果Cache满了怎么办?
- CPU修改了Cache中的数据副本,如何确保主存中数据母本的一致性?
- ——Cache和主存的映射方式
- --替换算法
- ——Cache写策略



△ 公众号: 王道在线



b站: 王道计算机教育



**抖音**: 王道计算机考研